ChIP-seq和RNA-seq整合分析,BETA最擅长 | 自己分析数据的完美解决方案
如何用自己的双手,分析自己的数据?
文末有完美解决方案
用BETA能get到哪些生物学特征?
预测转录因子的功能是激活还是抑制;
识别转录因子的靶基因;
鉴定转录因子motif及其collaborator。
输入文件长啥样?
BETA Basic和BETA plus需要2个输入文件。输入文件一,TF结合位点,即peak的位置;输入文件二,敲降或敲除或过表达或激活TF后所有基因的变化倍数和P值。
BETA Basic能预测转录因子的激活/抑制功能,并识别靶基因;
BETA plus除了Basic的两个功能外,还能鉴定转录因子motif及其collaborator。
如果只有ChIP数据,没有基因表达数据,还有BETA minus可以用,它能根据ChIP数据算出TF对靶基因的调控潜力。
BETA minus只需要1个输入文件,即输入文件一,peak所在的位置
输入文件一:
ChIP-seq的peak所在的染色体、start、end三列;
或MACS的输出文件*peak.bed
ChIP-chip的peak也可以作为输入文件一
输入文件二:
TF KD/KO/overexpressed/activeted样品与对照相比,基因表达差异分析结果:全基因组上的所有基因的ID、表达量变化倍数log值(上调为正值,下调为负值)、统计值(FDR或P值)三列;
或limma、cuffdiff的输出文件
注意,不能只给差异基因。
跟GSEA类似,BETA的算法需要全局所有基因。
除了RNA-seq、microarray以外,其他实验类型也可以作为输入,只要能按要求提供那三列信息就行。
参数设置:默认即可。
输出文件长啥样?
结果一:累积分布函数CDF曲线
BETA根据默认值或您提供的基因数量或P值,把基因分为上调UP、下调DOWN、不差异表达NON三组,然后计算UP/DOWN组跟NON的差异显著性。
图中黑色点线用NON组代表背景,红色为UP组,蓝色为DOWN组。
X轴:把基因按照regulatory potential score由大到小排序;
Y轴:基因累积比例。
例如下图a,X轴10000对应的蓝线Y轴为50%,红线Y轴为30%,黑色点线Y轴为30%。
也就是说:50%的下调基因都拥有较高的调控潜能(排在top10000),显著高于上调基因和背景。更多的peak倾向于富集在下调基因周围。
生物学意义:Tet1的功能是repressive,ESR1既有activiting又有repressive功能
有一篇帖子,从概念、实际意义到R语言实现,把CDF曲线讲的透透的:
http://blog.shaochuancs.com/statistics-cdf/
点击左下角“阅读原文”,直达该帖。
结果二:靶基因
靶基因附近的peak
结果三:TF在DNA上结合的motif,包括上调靶基因区域的motif、下调靶基因的motif、上调特异的motif(跟下调的比、跟NON比)、下调特异的motif(跟上调的比、跟NON比)。
结果四:找到TF的collaborator
从结果三可以看出,找到的motif不只是目标TF的,还有其他TF的,排除相似motif以后,那些其他的TF就有可能是目标TF的collaborator。coIP搞起来!
怎么才能用上BETA呢?
有网页版吗?
有,Cistrome Analysis Pipeline提供丰富的表观遗传分析工具,可以在线分析,点点鼠标即可,不用敲代码。只是,由于不可描述的原因,小哈劝您还是用本地下载版本吧!
Windows系统能用吗?
理论上,应该可以吧!?
不懂生信,不装Linux,也能Run代码—Windows系统的Linux命令行工具Babun
如果不想装Linux,就买个苹果吧!
遇到问题可以问作者吗?
苏小妹一直活跃在BETA的google group上,有问题先去看看是不是已经有人问过了,解决了没?
在此感谢BETA作者苏小妹在本文撰写中提供的帮助!
如何打开google group?
看这里,生物人高效工作之——办公软件
使用BETA的快捷方式
找嘉因小二,付款且收到合格的输入文件24h内,给您BETA分析结果。
长按下图,识别二维码
分析问题啊 ~ 实验问题啊 ~ 找对象问题啊 ~ 都可以骚扰他
用自己的双手,run自己的数据?
完美解决方案来啦!
来嘉因生物数据分析实验室
用嘉因生物的电脑run BETA
run pipeline
run MACS
run DESeq2
。。。
这就是——
用别人的电脑
用自己的双手
run自己的数据
面对面,一对一辅导
600元/小时/人
转发本文到朋友圈,截图发给嘉因小二,可获得嘉因生物电脑使用券1张
(面值1小时,长期有效)
截止到2017年8月1日,本文留言点赞数前10名获赠VIP卡一张,使用嘉因生物电脑享8折优惠。
写(发明)python的那个家伙去google面试,自我介绍:I wrote python
苏小妹的自我介绍:I wrote BETA
您指着您发表的paper自豪的说:I did the data analysis,I draw the figure,I wrote the paper ! ! !
ChIP实验还没做出来呢!?
嘉因生物为您解决
ChIP-seq技术贴
最靠谱的富集分析,超炫的展示方式,TCGA也是他的粉丝【老客户福利】
RNA-seq技术贴
RNA-seq要做几次生物学重复?找出来的100%都是真正的应答基因